|
|
| Acesso ao texto completo restrito à biblioteca da Embrapa Agricultura Digital. Para informações adicionais entre em contato com cnptia.biblioteca@embrapa.br. |
Registro Completo |
Biblioteca(s): |
Embrapa Agricultura Digital. |
Data corrente: |
23/12/1998 |
Data da última atualização: |
20/01/2020 |
Autoria: |
NASCIMENTO, M. A.; CUNHA, A. C. R. da. |
Afiliação: |
MARIO A. NASCIMENTO, CNPTIA; ADRIANO C. R. DA CUNHA, IC/UNICAMP. |
Título: |
An experiment stemming non-traditional text. |
Ano de publicação: |
1998 |
Fonte/Imprenta: |
In: STRING PROCESSING AND INFORMATION RETRIEVAL: A SOUTH AMERICAN SYMPOSIUM, 1998, Santa Cruz de la Sierra. Proceedings... Los Alamitos: IEEE Computer Society, 1998. |
Páginas: |
p. 75-80. |
DOI: |
10.1109/SPIRE.1998.712985 |
Idioma: |
Inglês |
Conteúdo: |
Stemming is a technique which aims to extract common suffixes of words. Thus, words which are literally different but have a commom stem, may be abstracted by their common stem. The underlying goal when using a stemming techniques is to improve recall, at the possible expense of precision loss. A well known technique for stemming text is Porter's algorithm, which is based on a set of rules extracted from the English language. In this paper, we argue that such an algorithm it is not efficient for non-traditional texts, e.g., one made up mainly of medical terms. We thus investigate the use of a technique, called Peak-and-Plateau, which is based on tries, and compare it to Porter's algorithm. Our experiments have shown that using Porter's algorithm or none at all makes no difference as far as precision and recall goes. On the other hand, using the Peak-and Plateau technique we improved recall by about 15% and decreased precision by an average of 40%. Moreover, it compressed the original text by 40% and the inverted file by 45%. |
Palavras-Chave: |
Recuperação de informação; Stemming. |
Thesaurus Nal: |
Information retrieval. |
Categoria do assunto: |
-- |
Marc: |
LEADER 01695nam a2200181 a 4500 001 1006876 005 2020-01-20 008 1998 bl uuuu u00u1 u #d 024 7 $a10.1109/SPIRE.1998.712985$2DOI 100 1 $aNASCIMENTO, M. A. 245 $aAn experiment stemming non-traditional text.$h[electronic resource] 260 $aIn: STRING PROCESSING AND INFORMATION RETRIEVAL: A SOUTH AMERICAN SYMPOSIUM, 1998, Santa Cruz de la Sierra. Proceedings... Los Alamitos: IEEE Computer Society$c1998 300 $ap. 75-80. 520 $aStemming is a technique which aims to extract common suffixes of words. Thus, words which are literally different but have a commom stem, may be abstracted by their common stem. The underlying goal when using a stemming techniques is to improve recall, at the possible expense of precision loss. A well known technique for stemming text is Porter's algorithm, which is based on a set of rules extracted from the English language. In this paper, we argue that such an algorithm it is not efficient for non-traditional texts, e.g., one made up mainly of medical terms. We thus investigate the use of a technique, called Peak-and-Plateau, which is based on tries, and compare it to Porter's algorithm. Our experiments have shown that using Porter's algorithm or none at all makes no difference as far as precision and recall goes. On the other hand, using the Peak-and Plateau technique we improved recall by about 15% and decreased precision by an average of 40%. Moreover, it compressed the original text by 40% and the inverted file by 45%. 650 $aInformation retrieval 653 $aRecuperação de informação 653 $aStemming 700 1 $aCUNHA, A. C. R. da
Download
Esconder MarcMostrar Marc Completo |
Registro original: |
Embrapa Agricultura Digital (CNPTIA) |
|
Biblioteca |
ID |
Origem |
Tipo/Formato |
Classificação |
Cutter |
Registro |
Volume |
Status |
URL |
Voltar
|
|
| Acesso ao texto completo restrito à biblioteca da Embrapa Uva e Vinho. Para informações adicionais entre em contato com cnpuv.biblioteca@embrapa.br. |
Registro Completo
Biblioteca(s): |
Embrapa Uva e Vinho. |
Data corrente: |
25/01/2008 |
Data da última atualização: |
05/01/2012 |
Tipo da produção científica: |
Resumo em Anais de Congresso |
Autoria: |
LIMA FILHO, J. M. P.; COSTA, A. L. C.; SOARES, J. M.; PEREIRA, G. E.; SANTOS, J. de O.; ALENCAR, Y. C. L. de. |
Afiliação: |
Giuliano Elias Pereira, Embrapa Uva e Vinho; José Moacir Pinheiro Lima Filho, Embrapa Semi-Árido; André Luis Chaves Costa, Facepe/Embrapa Semi-Árido; José Monteiro Soares, Embrapa Semi-Árido; Juliana de Oliveira Santos, ITEP/CNPq/Embrapa Semi-Árido; Yitzhak Coelho Lins de Alencar, Facepe/Embrapa Semi-Árido. |
Título: |
Ecophysiological responses of the winegrape "Chenin Blan" under different irrigation management in the São Francisco River Valley. |
Ano de publicação: |
2007 |
Fonte/Imprenta: |
In: CONGRESO LATINOAMERICANO DE VITICULTURA Y ENOLOGIA, 11., 2007, Mendoza. Seduciendo al consumidor de hoy: anales. [Mendoza: INV: CLEIFRA], 2007. |
Descrição Física: |
1 CD-ROM. |
Idioma: |
Português |
Notas: |
Resumo. |
Palavras-Chave: |
Região do Vale do São Francisco; Transpiração. |
Thesagro: |
Fisiologia Vegetal; Fotossíntese; Irrigação; Manejo; Potencial Hídrico; Uva; Viticultura. |
Categoria do assunto: |
-- |
Marc: |
LEADER 00985naa a2200301 a 4500 001 1542342 005 2012-01-05 008 2007 bl uuuu u00u1 u #d 100 1 $aLIMA FILHO, J. M. P. 245 $aEcophysiological responses of the winegrape "Chenin Blan" under different irrigation management in the São Francisco River Valley. 260 $c2007 300 $c1 CD-ROM. 500 $aResumo. 650 $aFisiologia Vegetal 650 $aFotossíntese 650 $aIrrigação 650 $aManejo 650 $aPotencial Hídrico 650 $aUva 650 $aViticultura 653 $aRegião do Vale do São Francisco 653 $aTranspiração 700 1 $aCOSTA, A. L. C. 700 1 $aSOARES, J. M. 700 1 $aPEREIRA, G. E. 700 1 $aSANTOS, J. de O. 700 1 $aALENCAR, Y. C. L. de 773 $tIn: CONGRESO LATINOAMERICANO DE VITICULTURA Y ENOLOGIA, 11., 2007, Mendoza. Seduciendo al consumidor de hoy: anales. [Mendoza: INV: CLEIFRA], 2007.
Download
Esconder MarcMostrar Marc Completo |
Registro original: |
Embrapa Uva e Vinho (CNPUV) |
|
Biblioteca |
ID |
Origem |
Tipo/Formato |
Classificação |
Cutter |
Registro |
Volume |
Status |
Fechar
|
Nenhum registro encontrado para a expressão de busca informada. |
|
|